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线性 扫 频 干扰 检测 算法 及 抗 干扰 方法 研究 ， 
韩 晨 !， 牛 英 滔 ?， 夏 志 !， 着 天 洋 ! 


(1. 陆军 工程 大 学 ， 南京 210000; 2. 南京 电讯 技术 研究 所 ,南京 210007) 


摘 要 : 线性 扫 频 干扰 是 战场 中 常用 的 干扰 样式 之 一 ， ee 提出 
一 种 考虑 虚 警 概率 和 漏 检 概 率 指标 的 低 复杂 度 线 性 扫 频 干扰 检测 算法 ， 并 对 工法 性 能 进行 了 理论 分 析 ， 为 实际 通信 系 
统 判断 受 扰 情况 提供 判断 依据 ; 然后 ， 提 出 一 种 基于 Q 学 习 的 抗 扫 频 干扰 算法 ， 可 在 无 线 通信 系统 遭遇 扫 频 干扰 时 ， 
自主 选择 最 佳 的 通信 信道 和 最 长 驻 留 时 间 。 最 后 仿真 结果 表明 所 提 检 测算 法 可 有 效 检 测 出 线性 扫 频 干扰 信号 ， 以 较 低 
复杂 度 得 到 与 理论 分 析 结果 相近 的 检测 性 能 。 所 提 抗 扫 频 干扰 学 习 和 工法 可 在 干扰 环境 中 自主 选择 通信 信道 ， 高 效 规避 
扫 频 干扰 ， 实 现 持 续 可 靠 的 信息 传输 。 
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Abstract: The linear sweeping jamming is one of the common jamming patterns in the battlefield. It is of great significance to 


detect the sweeping jamming and make effective anti-jamming decision. In this paper, the authors proposed a detection 


i algorithm for sweeping jamming with low complexity under the constraint of the probability of false alarm and missed 
detection, and theoretically analyzed the performance of the detection algorithm to provide the basis for judging the 
disturbance of the actual communication system. Then, the authors proposed an anti-jamming learning algorithm based on 
Q-Learning, which can be used to autonomously select the best communication channel and the maximal reliable transmission 
time when the wireless communication system is threatened by sweeping jamming. Finally, the simulation results show that 
the proposed detection algorithm can effectively detect the linear sweeping jamming, and the detection performance is 
basically consistent with the theoretical analysis results with low complexity. The anti-jamming learning algorithm can 
adaptively determine the optimal communication channel, and effectively avoid the sweeping jamming to realize the reliable 
information transmission. 

Key words: linear sweeping jamming; communication anti-jamming; probability of missed detection; probability of false 


alarm; Q-learning; channel selection 


0 引言 时 有 效 的 检测 具有 重要 意义 外。 
前 对 线性 扫 频 干扰 的 检测 已 经 有 了 一 些 成 熟 的 分 析 方 法 
军事 无 线 通信 已 成 为 决定 现代 战争 胜 负 的 关键 因素 之 一 ， 和 思路 。Wigner-Ville 分 布 对 线性 扫 频 干扰 的 检测 而 言 , 具有 
其 可 靠 性 和 有 效 性 将 直接 决定 战场 信息 的 共享 程度 由 。 敌 方 的 。 好 的 视频 聚集 性 ,但 当 干 扰 数 目 增加 时 ， 易 受 交叉 项 的 影响 。 
恶意 干扰 是 影响 无 线 通信 可 靠 性 与 有 效 性 的 主要 因素 之 一 ， 而 “文献 [4~6] 提 出 与 Hough 变换 结合 的 Wigner-Houg 变换 算法 , 进 
线性 扫 频 干扰 具有 产生 简单 、 干 扰 带 宽大 、 干扰 效率 高 等 优势 ， 一 步 改 善 了 检测 性 能 。 pa tn 可 夫 
已 成 为 敌 方 常用 的 干扰 样式 之 一 ， 所 以 对 线性 扫 频 干扰 进行 及 ”模型 识别 算法 ， 并 对 模型 参数 进行 实时 估计 ， 解 决 了 扩 频 通信 
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中 扫 频 干扰 的 抑制 问题 名。 
法 在 分 数 阶 域 对 扫 频 信 


文献 [9] 则 利用 分 数 阶 传 里 叶 变 换 方 
号 进行 干扰 检测 。 这 些 文献 对 于 扫 频 信 
号 的 检测 及 其 抑制 都 做 出 了 有 益 的 探索 中 。 但 是 ， 已 有 算法 还 
存在 复杂 度 高 、 主 要 检测 弱 扫 频 信号 、 缺 乏 对 检测 性 能 的 理论 
分 析 等 问题 ， 难 以 满足 军事 无 线 通 信 系 统 对 于 扫 频 干扰 的 感知 
要 求 。 

以 Q 学 习 为 代表 的 强化 学 习 技 术 在 无 线 通信 中 已经 得 到 1 
泛 应 用 。 文 献 [11] 研 究 分 布 式 动态 频谱 接 入 网 络 中 的 频谱 和 功 
率 分 配 问题 ， 首 先 通过 Q 学 习 解 决 频谱 分 配 问 题 ， 然 后 将 功率 
分 配 视 为 最 优化 问题 ， 以 减少 计算 复杂 度 、 增 强 实时 性 。 文 献 
[12] 提 出 基于 Q 学 习 的 实时 路 由 选择 算法 ， 解 决 在 移动 自 组 织 
A he tesa en 


b) 宽 带 检测 器 检测 带宽 为 W， 可 检测 这 N 个 信道 内 的 能 量 
值 , 每 次 检测 所 需 样 点 数 为 2NL.。 扫 频 干扰 带宽 满足 Www <W 。 

9 在 整个 检测 过 程 最 多 检测 Wi 次 ， 每 次 检测 时 长 为 ， 
总 检测 时 长 Mi ss7。 


d) 每 次 检测 时 长 五 足够 短 ， 检 测 期 间 扫 频 信号 可 近似 视 为 
固定 频率 信号 

e) 可 靠 传输 时 间 定 义 为 从 开始 通信 到 遭受 干扰 通信 中 断 时 
为 止 ， 所 经 历 的 传输 时 间 。 


2 ” 低 复杂 度 线性 扫 频 干扰 检测 算法 


本 章 提 出 一 种 考虑 虚 警 概率 和 漏 检 概率 指标 的 低 复杂 度 的 
线性 扫 频 干扰 检测 算法 ， 为 实际 通信 系统 判断 受 扰 情 况 提 供 判 


献 [13] 在 抗 干扰 博 蛮 框架 下 ， 采 用 最 小 最 大 Q 学 习 解 决 认 知 干 
扰 威 胁 下 的 频谱 分 配 问 题 。 已 有 文献 中 ， 应 用 强化 学 习 技 术 进 
行 抗 扫 频 干扰 决策 的 研究 还 较 少 。 对 于 遭受 干扰 攻击 的 无 线 通 
信和 系统 而 言 , 可 引入 强化 学 习 技术 , 通过 对 干扰 的 感知 和 学 习 ， 
发 现 干 扰 规 律 ， 有 效 预 测 干 扰 行 为 ， 使 无 线 通信 系统 可 以 动态 
适应 电磁 环境 ， 实 现 高 效 可 靠 的 数据 传输 。 
本 文 研究 了 在 虚 警 概率 、 漏 检 概 率 等 性 能 指标 的 约束 下 ， 
对 线性 扫 频 干扰 进行 有 效 检测 的 问题 ， 对 检测 性 能 进行 理论 推 
导 ， 为 实际 通信 系统 判断 受 扰 情 况 提 供 了 理论 依据 。 然 后 利用 
Q 学 习 算 法 实现 在 扫 频 干 捧 下 的 可 靠 传 输 。 最 后 基于 军事 无 线 
通信 需求 对 检测 性 能 的 理论 推导 及 抗 干扰 学 习 算法 进行 仿真 验 


To。 
1 ”系统 模型 


线性 扫 频 干扰 是 一 种 干扰 信号 对 目标 频段 进行 周期 性 线性 
扫描 ， 从 而 有 效 降低 目标 频段 内 无 线 通 信 可 靠 性 或 有 效 性 
扰 样 式 。 本 文 所 考虑 的 干扰 信号 为 服从 正 态 分 布 的 窄带 高 斯 
噪声 信号 ， 信 和 号 带宽 为 Wu 。 在 一 个 扫描 周期 7 内 , 干扰 信 
的 中 心 频率 从 最 低频 fi 移动 到 最 高 频 fs ， 形 成 对 目标 频段 的 
扫描 式 干 扰 。 扫 频 干扰 信号 /ww(D) 表达 式 为 
J uw (D = Filter [1,0(0), f(D] (1) 
其 中 : ”Filter[e] 表示 对 信号 进行 窄带 滤波 ， yuo(D 表示 零 均值 
服从 正 态 分 布 的 高 斯 白 噪声 信号 ， 其 方差 为 N(0，o,”) ; 


wr 
| 


尘 
| 


fa -hh ( (4 一 1)x7T) 表示 第 h(h=12..,) 个 扫 4 


周期 内 ， 窗 带 滤波 器 的 瞬时 中 心 频率 。 
当 存 在 线性 扫 频 干扰 时 , AWGN 信道 下 
到 的 采样 信号 为 : 


无 线 通信 系统 接收 


Xx(n) = J pip (n) +no(n) (2) 
其 中 x(n) 表示 接收 信号 ，no() 表示 信道 中 零 均 值 的 高 
噪声 ， 方 差 为 c” 。 
为 便于 研究 ， 对 算法 条 件 作 出 以 下 假设 : 
a) 目 标 频 谱 由 N 个 在 频 域 上 互 不 重 盖 的 信道 组 成 ， 每 个 信 
道 带宽 为 W, ， 目 标 频 谱 带 宽 为 W= NW 。 


断 标 准 。 上 有 具体 算 法 步 又 如 下 所 示 : 
a) 计算 目标 频段 的 功率 谱 。 在 第 mm=1,2.…M) 个 检测 时 
刻 ，NP 能 量 检测 器 对 目标 频段 使 用 修正 周期 图 法 进行 功率 谱 
计算 。 第 m 次 检测 得 到 的 频率 点 的 功率 谱 值 为 
> wDx(De 7 


人 
fm 
P(f)= 2 INLA 


》 |w()| /2NL 


= = 


2NL-1 


(3) 


m=1,2,3...M, 


其 中 :2NL 为 采样 点 数 ， 
本 文选 用 汉 明 窗 。 

b) 计算 各 信道 中 的 能 量 值 。 式 (3) 中 得 到 的 功率 谱 点 数 为 
NL 点 ,将 功率 谱 按 顺序 等 分 为 N 段 , 每 段 功 率 谱 点 数 为 L， 对 
应 于 一 个 信道 。 第 m 次 检测 第 i 个 信道 中 的 能 量 值 可 计算 为 


x(1) 为 采样 值 ，w(/) 为 窗 函 数 ， 


W, 蕊 
Ei = Pfie va]) 
让 ] 
i (4) 
= "fil Det]) 
c) 判断 N 个 信道 中 是 否 有 信道 在 第 m 次 检测 中 受 扰 。 将 


第 m 次 检测 第 i 个 信道 的 能 量 值 5 与 检测 门限 XY 比较 ， 门 限 
值 Y 由 虚 警 概率 指标 Ps 给 出 : 


7=0°0, (Pe) (5) 


若 Ei >Y 则 判定 为 m 时 刻 i 信道 受到 干扰 , 记 为 ,>0; 
反之 ， 则 判 为 m 次 检测 第 i 个 信道 未 受到 干扰 ， 记 为 {=0。 
d) 按 上 述 方法 对 目标 频段 检测 M1 次 。 若 第 m1 次 检测 
时 信道 i 未 受 扰 , 第 m 次 检测 时 该 信道 受 扰 , 而 m+1 次 检测 时 


该 信道 的 干扰 消失 ， 则 判定 为 i 信道 受到 动态 干扰 : 
L,={L,1=0;7, >0;1, =0}>0 (6) 
e) 根据 给 定 的 漏 检 概率 指标 h， 计 算 检测 信 道 数目 的 信 
道门 限 值 M: 
B= SCP x -py 
En (7) 
M=arg{P,} 
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其 中 : 五 为 单 信道 动态 干扰 检测 概率 。 
个 信道 中 至 少 有 M 个 信道 受到 动态 干扰 , 则 判 为 该 频段 受到 动 
态 干 扰 。 漏 检 概率 P, 定义 为 实际 受到 动态 干扰 , 但 未 检测 出 干 
扰 存 在 的 概率 。 

f) 将 检测 到 受 扰 的 频 点 分 为 奇偶 两 组 , 分 别 使 用 最 小 二 乘 


法 拟 合成 直线 : y。=Ax+B。 ,y, =Xx+B,。 若 两 条 拟 合 直 线 
参数 的 相似 程度 大 于 门限 值 7， 
(8) 


即 认为 受到 线性 扫 频 干扰 。 
3 ”检测 算法 性 能 分 析 


本 章 对 所 提出 的 考虑 虚 警 概率 和 漏 检 概率 指标 的 低 复杂 度 
线性 扫 频 干扰 检测 算法 进行 理论 分 析 。 
3.1 NP 检测 器 
干扰 信号 的 检测 问题 可 视 为 三 元 假设 的 选择 问题 ,根据 NP 
定理 构建 NP 检测 器 为 
Ho :x(n)=n,(n) 

n=0,1...2NL-—1 
1: X(Nn)=n,(n)+ J ip (n) 

n=0,1...2NL-—1 
其 中 : H 假设 观测 值 x(n) 中 只 有 噪声 ;于 假设 观测 值 x(n) 中 
既 有 干扰 信号 又 有 噪声 。2NZ 次 采样 相互 独立 ， 构 造 似 然 比 函 
数 L(x) ， 若 似 然 比 超过 门限 值 7: 


H (9) 


(10) 


NP 检测 器 判 为 Hi 假设, 判定 存在 干扰 信号 , 反之 判 为 Ho 
假设 。 其 中 p(x|H,) 表示 HH 假设 下 观测 值 的 概率 密度 函数 ， 
P(x|Ho ) 表示 Ho 假设 下 观测 值 的 概率 密度 函数 。 
3.2 干扰 信号 检测 性 能 分 析 

0 如 式 (9) 所 示 ， 在 Ho 条件 下 ， 
x(n)~N(0,0”) ; 在 H 条件 下 ，x(n)~N(0,0”+o?) 。 此 时 对 数 
形式 的 似 然 比 函 8 


(11) 


化 简 整理 并 将 与 观测 值 无 关 的 常 
可 得 检测 量 7(z) 为 


由 


与 门限 值 X 合并 成 7 ， 


roo= 之 oo>y (12) 

如 果 T(x) 超过 新 门限 值 y ， 则 判 为 Hl 假设 成 立 ， 判 定 存 

在 干扰 信号 。 x(n) 服从 高 斯 分 布 ，T(x) 是 2NL 个 独立 同 分 布 

的 高 斯 随机 变量 的 平方 和 。 在 Ho 条件 下 ，7T/o” 服从 自由 度 为 

2NL 的 卡 方 分 布 ; 在 蕊 条 件 下 ，7/(c" + as?) 服从 自由 度 为 2VL 
的 卡 方 分 布 。 自 由 度 为 v 的 卡 方 分 布 用 必 表 示 。 


若 在 Mi 次 检测 中 ，N 
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T  ， 
Ho: Xan 
(13) 
了 
H,: O77+ 7 ~X2n 
定义 如 在 [x,%] 区 间 内 的 概率 积分 为 Qj : 
当 vy=1 时 ， 
oo a 
v>1 且 为 奇数 ， 
eX ~! 
poe Pl 2 ee D12x) 有 
* Yr A Qk-D)! (15) 
+20(0) 
Y>1 且 为 偶数 ， 


v—l 自 
0 -on Le 0 


其 中 Q(X) ee D0 为 服从 N(0,D) 分 布 
的 随机 变量 的 概率 密度 函 
3.3” 单 信道 动态 干扰 检测 概率 

实际 没有 干扰 却 检测 到 干扰 信号 存在 ， 这 类 错误 用 虚 警 概 
率 Ps 表示 为 


B= {T(x) >7y|H, } 


oo? (17) 
加 类 
人 加 
所 以 最 终 的 检测 门限 值 X 由 给 定 的 虚 警 概 率 计算 得 出 
7=00,, (Ps) (18) 


单 信道 动态 干扰 检测 概率 户 | 为 实际 存在 干扰 并 且 正 确 检 
测 出 干扰 存在 的 概率 , ;为 实际 不 存在 干扰 并 且 正 确 检测 到 不 
存在 干扰 的 概率 。 已 ; 、 记 ;分别 为 


P=P{T(x)>7y|H,} 
T(x) 7 
| 7 二 > 一 5 z| 了 
Oto Ol+0, (19) 
7Y 
0 [| 


P,=P{T(x) <7y|H,} 
=1-P{7(0) >7|H,) 


0 
ti\lo 


结合 算法 可 知 ， 信 道 i 上 存在 动态 干扰 的 检测 概率 ;为 
Ps = Py nm 1 xP, m x Phy (21) 


3.4 线性 扫 频 干扰 检测 性 能 
己 知 干扰 存在 的 前 提 下 ， 


(20) 


通信 系统 对 动态 干扰 最 终 的 漏 检 


201811.00161v1 


chinaXiv 


录用 定稿 韩 


概率 和 检测 概率 分 别 为 PB, 、P 了 =1-P,。 给 定 漏 检 概率 指标 ， 
式 (7) 可 得 到 判决 该 频段 是 否 受 到 动态 干扰 的 受 扰 信 道门 限 
值 M。 若 经 Mi 次 检测 ，N 个 信道 中 至 少 有 M 个 信道 检 出 受到 
动态 干扰 即 判 为 该 频段 受到 动态 干扰 。 将 受 扰 频 点 线性 拟 合 ， 
若 近 似 为 一 条 直线 ， 则 判 为 受到 线性 扫 频 干扰 。 
式 (7) 分 析 可 知 ， 信 道门 限 值 M 设 定 越 大 ，P, 越 大 ，P 
越 小 ， 对 动态 干扰 的 检测 概率 越 低 ， 但 是 在 实际 检测 中 未 知 敌 
方 干扰 状态 的 前 提 下 ， 若 最 终 检 测 器 判 为 干扰 存在 ， 则 该 结果 
的 可 信和 度 也 越 高 。 


4 基于 Q 学 习 的 抗 扫 频 干扰 算法 


Q 学 习 算 法 是 典型 的 强化 学 习 算法 , 智能 体 应 用 Q 学 习 算 
法 可 以 根据 环境 的 反馈 信息 ， 主 动 调整 执行 策略 ， 实 现 智能 体 
与 环境 的 自 适 应 交互 ， 提 高 智能 体 对 环境 的 适应 能 力 。 如 图 1 
所 示 ， 当 前 状态 s 下 ， 智 能 体 根据 当前 选择 策略 7 ， 选 择 一 个 
动作 a 作用 于 未 知 环境 ， 同 时 获得 环境 反馈 信号 + ， 由 此 更 新 
Q 函数 ， 并 指导 下 一 轮 动作 选择 。 经 过 不 断 地 学 习 ， 智 能 体 最 
终 可 以 找到 最 优 的 动作 选择 策略 0。 


Q-Learning 智 能 体 


图 1 Q 学 习 算法 

Fig .1 Q-learning algorithm 
在 无 线 通 信和 领域 中 QQ 学 习 算法 广泛 用 于 解决 无 线 通 信 系统 
与 电磁 环境 的 动态 交互 问题 。 然而, 在 存在 恶意 干扰 的 环境 中 ， 
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与 “利用 ”051 


a = random( A) Num>€ 
a=argmaxQ(s,a) Num<eé (26) 


其 中 ,se e (0,1) , Num 表示 生成 的 [0,1] 之 间 随 机 数 , 若 Num > ， 
则 从 动作 集合 中 随机 选择 执行 动作 ,“ 探 索 ” 更 优 的 选择 策略 ; 
若 Num<&， 则 “利用 ”已 得 到 的 Q 表 ， 选 择 可 使 Q 值 最 大 的 
执行 动作 。 而 对 于 通信 抗 干扰 而 言 ， 通 信 双 方 在 获得 抗 干扰 决 
策 知 识 后 ， 需 要 建立 稳定 的 通信 行为 ， 以 满足 通信 需求 。 所 以 
采用 固定 的 2 值 进行 “探索 ”与 “利用 ”权衡 的 方法 ， 不 利于 
学 习 过 程 的 稳定 收敛 。 故 在 抗 干扰 场景 下 ， 本 文 基于 模拟 退火 
模型 实现 “探索 ”与 “利用 ”的 平滑 过 渡 ， 当 获得 完整 的 抗 干 
扰 决 策 知识 后 ， 可 建立 稳定 的 通信 行为 ， 以 更 好 地 实现 智能 通 
信 抗 干扰 学 习 。 

通信 选择 策略 按 下 式 更 新 : 


QGs ,au )/ 


t 1) 
s/s 十 Dr a)/E (27) 
a 


x(a,|s,)= 
+ 1 TQ 


其 中 : a 代表 除 当 前 通信 信道 a 外 的 其 他 信道 ，& ,7 为 波 尔 
效 曼 模型 的 相关 参数 ，P(a,|s,) 表示 在 状态 % 下 选择 动作 a 的 
概率 。 


二 | 


g= EE o> © pal 
GS = Gpna GC < Gpnal 
其 中 ; G6 与 “探索 四 时 间 正 相 关 ， Gfnat 表示 四 探索 阶段 的 结 


(28) 


束 条 件 ，z 、。 影响 “探索 ”阶段 与 “利用 ”阶段 之 间 的 过 渡 
时 间 。 


基于 Q 学 习 算 法 ， 提 出 抗 扫 频 干扰 算法 如 下 所 示 。 
a) 初始 化 Q=[s,a] 为 零 矩 阵 ， 初 始 学 习 速率 xm ， 学 习 规 
则 中 的 退火 初始 温度 名、 最 终 温 度 “mu 及 波 尔 兹 曼 参 数 + 和 退 


应 用 Q 学 习 算法 实现 智能 抗 干扰 通信 的 相关 研究 还 比较 少 。 在 
第 3 章 检测 算法 的 基础 上 ,结合 Q 学 习 算 法 ， 本 节 提 出 一 种 抗 
扫 频 干扰 学 习 算 法 ， 实 现 无 线 通信 系统 在 扫 频 干扰 下 的 智能 高 
效 的 抗 干扰 通信 。 
根据 检测 算法 结果 ， 定 义 状态 空间 S，s, eS : 
S=[1,2,...N] (22) 
其 中 5, 为 1 时 刻 扫 频 干扰 所 在 信道 。 
定义 动作 空间 A，a, sA : 

A=[1,2,...N] (23) 


其 中 , a, 表示 用 户 在 1 时 刻 选择 的 通信 信道 ,此 时 的 回报 函数 
为 
7=Z -7 (24) 


其 中 : 研 为 开始 通信 时 刻 ， 碾 为 遭受 干扰 ， 通 信 中 断 时 刻 。 用 
户 的 通信 选择 策略 定义 为 当前 状态 s, 下 选择 各 种 可 能 动作 
4 的 一 种 概率 分 布 。 用 户 的 优化 目标 是 寻找 最 佳 的 选择 策略 
Xx" ， 使 得 用 户 的 可 靠 传输 时 间 最 长 。 

x" =P(a,|s,) (25) 
般 采 用 固定 & 贪 禁 模 型 权衡 “探索 ” 


传统 Q 学 习 算 法 ， 


火速 率 2 ， 初 始 化 通信 选择 策略 已 (als) =J/|A| ， 从 状态 集 A 
中 随机 选择 一 个 信道 作为 当前 通信 信道。 
b) 在 每 个 时 隙 1， 重复 下 面 过 程 : 
Ca) 按照 当前 的 通信 策略 ， 选 择 动作 4 ， 计 算 收 到 的 
报 值 
Cb) 时 隙 结束 后 , 结合 以 往 观 测 值 及 本 次 选择 所 得 
按照 下 式 更 新 Q 表 : 
Q,(s,,4)=( -0Q, Ga)+or (29) 
(c) 根据 式 (27) 更 新 通信 选择 策略 : 
(d) 根 据 式 (28)(30) 更 新 流 尔 兹 曼 系 数 & 及 学 习 速 率 &: 
= / (Ks,a)log(A(s,a))) (30) 
其 中 : ao 表示 学 习 起 始 阶 段 的 学 习 步 长 ，x(s,a) 表示 访问 状态 
动作 对 (5,a) 的 次 数 ， 文献 [116] 已 证 明 车 满足 


I 


| 


报 厂 ， 


2 ww=o >2o<o， 则 Q 学 习 算法 可 以 收敛。 
1=0 1=0 


(e) 判断 是 否 达到 最 大 迭代 次 数 天 ， 若 否则 返回 步骤 b)。 
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为 验证 所 提 算 法 的 性 能 ， 运 用 MATLAB 进行 仿真 实验 。 


期 


二 0.05s 。 扫 


噪声 方差 co" =0 


干扰 带 


号 周 
宽 


的 


干扰 噪声 比 JNR 为 


设 定 采样 频率 Fs =20MHz ， 一 次 检测 时 间 T=0.5ms ， 
频 信号 最 低频 率 ， 最 高 频率 及 扫 频 
宽 分 别 为 =2MHz ，f =10MHz ，Wow =8MHz 。 
宽带 检测 器 检测 带宽 W =8MHz ,可 检测 N=100 个 信道 。 高 斯 
一 15~6dB 。 本 文采 用 罕 


Tim (1) = ojzz 人 7 下 


Pa 给 定时 ,经 上 述 


带 高 斯 噪声 调 几 


Ht 


J 


信 


的 高压 


白 噪 


[II 
号 


扫 频 信和 号 的 方法 / 


J opim (n) » 


= 


上 


fa -下 
T 


E 导 可 知 ,检测 门限 值 1 


式 (21) 可 计算 得 出 单 信道 动态 
测 器 的 检测 性 能 


生 扫 


最 级 = 


的 实验 结果 如 图 


频 干扰 信和 号。 
带宽 为 50KHz 的 窗 带 高 斯 噪声 Caxss(z) 。 然 
本 频 


扰 


G-chirp (n) > Gauss(n) x J oi (n) 二 Nn (1m) bE 式 中 71。 (n) 为 信道 环境 中 
满足 干 噪 比 为 -15~6dB ,其 中 


首先 产生 


后 用 该 噪声 调 


-二 月 


信 


人 0-(-Dx7)j| .应 格调 


ChinaX 


x 


Ne | 
Va, 名 员 


低 。 实 验 结果 表明 ， 所 以 检测 算法 可 以 以 较 低 的 复杂 度 
析 结 果 相 近 的 检测 性 能 。 


( O(nlogn) ) 实现 与 理 


论 分 


检测 概率 P 


门限 值 M 
图 3 不 同 虚 警 概率 条 件 下 的 检测 概率 


Fig .3 Detection probability under the condition of different false alarm 


probability. 


1 -00 09008488006 88 


检测 概率 P 
Er 
名 


be 一 6 一 PinJNR=-4dB 
-已 --P_ ;JNR=-4dB 
上 —F— PinJNR=-5dB 
一 米 -P ;JNR=-5dB 
| | -一 PiwJNR=-5.5dB 
-十 --P_;:JNR=-5.5dB 


Re A 6-: 


75 80 


图 4 不 同 干 噪 


85 
门限 值 M 


比 条 件 下 的 检测 概 


Fig .4 Detection probability with different JNR. 
-8 | 在 每 个 检测 周期 内 ， 将 受到 动态 干扰 的 信道 频 点 分 奇偶 数 
ee 分 别 进行 最 小 二 乘 线性 拟 合 ， 拟 合 曲线 如 图 5 中 蓝 色 虚线 所 示 

图 2 单 次 干扰 检测 概率 (为 便于 展示 抗 干 扰 效 果 ， 此 处 仿真 令 N=10)。 图 5 中 展示 J 
Fig .2 Detection probability of jamming in a single detection. 两 个 周期 内 扫 频 干扰 信号 的 时 频 干扰 规律 。 基 于 检测 结果 ， 利 
设 定 虚 警 概率 PB 分 别 为 10 了 ”了 、10”、10™， 由 图 2 可 得 ， 用 抗 扫 频 干扰 学 习 算法 寻找 可 保证 最 大 可 靠 传输 时 间 的 信道 选 

单 次 检测 概率 钙 与 理论 值 Po 基本 一 致 ， 所 提 检 测算 法 以 择 策 略 ， 如 图 5 中 红色 实 线 所 示 ， 基 于 当前 的 干扰 状态 ， 无 线 

O(nlogn) 的 较 低 复杂 度 实现 与 理论 分 析 结 果 相 近 的 检测 性 能 。 通信 系统 自主 选择 的 通信 信道 比 扫 频 信号 所 在 信道 滞后 一 个 信 

在 干 噪 比 JNR > -4dB 时 ,能 量 检测 器 检测 性 能 较 好 , 单 次 检测 。” 道 ， 当 扫 频 信号 干扰 最 低频 所 在 信道 时 ， 所 选 信 道 为 最 高 频 所 

概率 接近 于 1。 属 信道 。 此 时 ， 通 信 系 统 可 通过 自主 选择 通信 信道 ， 保 证 最 大 

图 3 表示 ,固定 干 品 比 JNR= 一 5dB ， 比 较 不 同 虚 警 概率 约 的 传输 驻 留 时 间 。 图 6 展示 了 所 提 抗 干扰 算法 与 盲 跳 频 抗 干扰 

束 下 ， 系 统 检测 概率 已 与 信道 门限 值 M 之 间 的 对 应 关系 。 干 ” 方法 、 及 基于 传统 贪 禁 准则 的 Q 学 习 算 法 c=0.8 〉 抗 干扰 方 

噪 比 恒定 时 ， 检 测 概 率 随 着 信道 门限 值 的 增 大 而 逐渐 减 小 ， 信 ”法 的 平均 可 靠 传输 时 间 的 性 能 比较 。 由 图 6 可 以 看 出 ， 所 提 算 


道门 限 值 设 定 越 高 ， 对 动态 干扰 的 检测 概率 越 小 ， 但 在 未 知 干 
度 越 高 。 虚 警 概率 指标 设 定 越 小 ， 
同 信道 门限 值 时 ， 可 得 到 的 检测 概 


扰 状 态 时 ， 检 测 结果 的 可 信 
单 次 检测 概率 越 


自 


率 越 低 。 


检测 概率 的 到 


图 4 中 


回 定 


氏 ， 设 定 相 


虚 警 概率 为 六 ,=10 ,比较 不 同 了 
E 论 值 与 实际 值 已 的 仿真 结果 。 虚 警 概率 恒 
时 ， 检 测 概率 、 检 测 信道 门限 值 一 一 对 
大 ， 检 测 概率 减 小， 未 知 干扰 状态 时 的 检测 可 信和 度 增 大 ;， 当 干 
品 比 JNR 逐渐 降低 时 ， 设 定 相同 信道 门限 值 ， 系 统 检测 概率 降 


F 噪 比 条件 下 ， 


应 ， 随 着 信道 门限 


6 ”结束 语 


法 可 保证 更 高 的 可 靠 传 输 时 间 ， 


y=- 


更 


-起 


对 线性 扫 频 干扰 信号 进行 及 时 


效 的 检 闹 


高 的 抗 


扰 性 能 。 


I 并 提出 相应 的 高 


效 抗 干扰 策略 是 军事 通信 抗 


扰 方 向 重要 的 研究 课题 。 本 文 提 


出 一 种 对 线性 扫 频 干扰 信号 进 


对 该 算法 进行 了 性 能 分 析 。 仿 


能 可 以 满足 给 定 的 虚 警 概率 和 


行 有 效 检测 的 宽带 检测 算法 ， 并 
结果 表明 ， 提 出 算法 的 检测 性 


0 漏 检 概率 指标 ， 


以 较 低 复杂 度 实 


现 较 好 的 检测 性 能 ， 可 满足 军事 无 线 通信 系统 对 于 扫 频 干扰 的 
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感知 要 求 ,同时 也 验证 了 对 检测 性 能 的 基础 理论 分 析 的 正确 性 。 
在 检测 结果 的 基础 上 , 提出 一 种 基于 Q 学 习 的 抗 扫 频 干扰 检测 
算法 ， 仿 真 结果 表明 该 算法 可 在 扫 频 干扰 下 ， 选 择 最 佳 信道 实 
现 持续 高 效 的 可 靠 传输 。 


1 上 h 1 1 L 一 这 1 1 1 
2 4 6 8 10 12 14 16 18 20 
时 刻 


图 5 扫 频 干扰 检测 结果 及 信道 选择 策略 


Fig .5 Detection results and channel Selection strategies. 


平均 可 靠 传输 时 间 


3 1 1 J 
0 1000 2000 3000 4000 5000 6000 7000 8000 


选 代 次 数 


图 6 


F 均 可 靠 传输 时 间 性 能 比较 


Fig .6 Comparison in the average reliable transmission time. 
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